1 research outputs found

    Generaci贸n autom谩tica de metadatos geogr谩ficos de p谩ginas Web

    Get PDF
    Este Trabajo Fin de M谩ster se dedic贸 al desarrollo de una arquitectura para la generaci贸n autom谩tica de metadatos geogr谩ficos para recursos de Web, con aspecto extensible y flexibilidad para la adici贸n de nuevas caracter铆sticas. Para el estudio de un caso de uso se desarroll贸 un prototipo que se emple贸 para la generaci贸n de registros OGC CSW que describen a los recursos Web. El primer experimento realizado para la validaci贸n del prototipo, sobre una muestra representativa de p谩ginas Web principales de geoportales, ha demostrado que el principal problema era la generaci贸n de informaci贸n sobre la extensi贸n geogr谩fica, ya que las p谩ginas Web no suelen contener metadatos geogr谩ficos espec铆ficos. Por esta raz贸n, el sistema se complement贸 con el uso de una herramienta NER que aplica algoritmos NLP para la extracci贸n de nombres de lugares del texto y el desarrollo de un componente para la estimaci贸n de la extensi贸n geogr谩fica (Bounding Box) que contempla los nombres geogr谩ficos encontrados dentro de los diferentes elementos de una p谩gina Web. Los resultados del segundo experimento pueden indicar que usando una heur铆stica muy simple (basada en la frecuencia de nombres geogr谩ficos y la agrupaci贸n seg煤n la pertenencia a una unidad de organizaci贸n territorial) se puede estimar la extensi贸n geogr谩fica, con un nivel satisfactorio, en casi un 70%
    corecore